課程名稱 |
丈量社會:運用因果機器學習技術 Measuring Treatment Effects with Causal Machine Learning Techniques |
開課學期 |
112-2 |
授課對象 |
社會科學院 公共事務研究所 |
授課教師 |
王敏衡 |
課號 |
GIPA5022 |
課程識別碼 |
343 U0310 |
班次 |
|
學分 |
1.0 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期四A,B(18:25~20:10) |
上課地點 |
社科研607 |
備註 |
與盧秉謙合授 限學士班三年級以上 總人數上限:20人 |
|
|
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
機器學習等資料科學相關技術為目前行為與社會科學,甚至資訊科學的熱門議題,而因果推論更是政策評估之重要方法。本課程欲教授結合兩者之方法,例如 causal forest 或是 double machine learning 等模型,以及 variance reduction techniques 等技巧,希望能夠讓修課學生掌握此較新的工具來分析公共政策相關的資料。學期中也會有兩次邀請在美國任職的資深資料科學家,以及在美商顧問業任職於 Client Training Team的資料分析師,分別進行資料科學技巧與資料視覺化原則的授課(非演講性質)。本課程偏重實務應用與操作,若希望有更深入的理論基礎,會推薦修習其他類似課程。 |
課程目標 |
能讓公共事務所研究所的學生建立一定程度的因果推論與機器學習知識,並懂得依照不同的需求與情境,使用相關的工具來進行資料分析。
● 具備基礎Python操作能力。
● 具備運用Python處理資料的能力。
● 瞭解資料分析或機器學習專案執行步驟。
● 具備機器學習與因果推論基礎知識。
● 具備之後將相關能力運用於研究或實務工作上之能力。 |
課程要求 |
1. 課堂出席率25%:可請假1次。(上課前)
2. 助教課出席率15%:可請假1次。(上課前)
3. 期末報告60%:運用課程所學,撰寫資料分析專題報告,並將程式、分析過程及結果分享於GitHub上。 |
預期每週課後學習時數 |
|
Office Hours |
|
指定閱讀 |
待補 |
參考書目 |
Python and Machine Learning
1. McKinney, W. (2012). Python for data analysis: Data wrangling with Pandas, NumPy, and IPython. " O'Reilly Media, Inc.".
2. Harrison, M., & Petrou, T. (2020). Pandas 1. x Cookbook: Practical recipes for scientific computing, time series analysis, and exploratory data analysis using Python. Packt Publishing Ltd.
3. Geron, A. (2022). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow. " O'Reilly Media, Inc.".
Causal Inference
1. Cunningham, S. (2021). Causal inference: The mixtape. Yale university press.
2. Facure, M. (2023). Causal Inference in Python. " O'Reilly Media, Inc.". |
評量方式 (僅供參考) |
|
週次 |
日期 |
單元主題 |
第1週 |
3/14 |
Week 1: Introduction to machine learning I
Machine Learning Applications
What is Machine Learning?
The Life Cycle of Machine Learning Projects
scoping
data preparation
modeling and evaluation
serving
monitoring
Data Science Roadmaps & Learning Resources |
第2週 |
3/21 |
Week 2: Introduction to Machine Learning II
Model Training Basics
Bias-variance Trade-off
Train-test Split
Hyperparameter Tuning
Model Validation
The Components of Machine Learning
Machine Learning Algorithm
Learning Objective
Optimization Strategies
Performance Metrics |
第3週 |
3/28 |
Week 3: Introduction to Machine Learning III and Causal Inference 101
Hyperparameter Optimization
Grid Search
Randomized Search
Bayesian Approach
Model Explainability
Feature Importance
Shapley Value and SHAP
Potential Outcome Model
ATE, ATT and Bias
Key Assumptions for Causal Inference from
Experimental data
observational data
Confoundedness, Self-selection, and Multicollinearity |
第4週 |
4/11 |
Week 4: Guest Lecture: Principles of Data Visualization
By Multinational Company Client Training Team Data Analyst, Victoria Yang |
第5週 |
4/18 |
Week 5: Guest Lecture: For More Efficient Experiments: Variance Reduction, Quantile Treatment Effect and Bootstrap
By Realtor.com Senior Data Scientist, Ying-Kai Huang |
第6週 |
4/25 |
Week 6: Tackling Measured / Unmeasured Confounding
Matching Methods
Instrument Variable, IV Forest
Double Machine Learning |
第7週 |
5/02 |
Week 7: Causal Mediation: Seeking Mechanism
Total, Direct, and Indirect Effects |
第8週 |
5/09 |
Week 8: Targeting the Right People
Honest Causal Trees/Forest
Heterogeneous Treatment Effects |
|